GitHub给出的三组数据分析
基因位置信息 pos
Chrom | Start | End | Strand | EnsemblID | GeneID | GeneSymbol | GeneName | FlankStart | FlankEnd |
---|---|---|---|---|---|---|---|---|---|
chr6 | 29587455 | 29589038 | + | ENSG00000204657.3 | ENSG00000204657.3 | OR2H2 | OR2H2 | 28587455 | 30587455 |
chr6 | 29602228 | 29633976 | - | ENSG00000204681.10 | ENSG00000204681.10 | GABBR1 | GABBR1 | 28602228 | 30602228 |
chr6 | 29656981 | 29672372 | + | ENSG00000204655.11 | ENSG00000204655.11 | MOG | MOG | 28656981 | 30656981 |
第一组数据(GWAS/QTL分析结果)
SNP
ID | Chromosome | Position | REF | ALT | rhyGene.ID | rhyGene.name | Sample.size.0 | Sample.size.1 | Sample.size.2 | pval_0 | phase_0 | amp_0 | pval_1 | phase_1 | amp_1 | Chosen.model | G.test_pval | pval |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
chr1_27360875_C_G_b38 | chr1 | 27360875 | C | G | ENSG00000000938.12 | FGR | 261 | 249 | 59 | 0.000180832419495009 | 19.7954981855796 | 0.626899050968903 | 0.363501568701486 | 20.4849165555806 | 0.187448803585998 | 2 | 0 | 0.000188246580715082 |
chr1_28566248_G_A_b38 | chr1 | 28566248 | G | A | ENSG00000000938.12 | FGR | 257 | 239 | 73 | 0.475559478668355 | 20.083459926903 | 0.180310470825895 | 4.40078612105749e-06 | 19.2888997874427 | 0.72450220673997 | 3 | 0 | 9.32080383273013e-07 |
第二组数据(转录因子结合位点分析结果)
Motif | Name | TF | rhyQTL+Motif+ | rhyQTL+Motif- | rhyQTL-Motif+ | rhyQTL-Motif- | OddsRatio | p.value |
---|---|---|---|---|---|---|---|---|
HAWGRGGCCM | Zac1(Zf)/Neuro2A-Plagl1-ChIP-Seq(GSE75942)/Homer | Zac1 | 382 | 98642 | 29591 | 10642246 | 1.39272803677047 | 1.03295297264592e-09 |
AGGCCTAG | ZNF711(Zf)/SHSY5Y-ZNF711-ChIP-Seq(GSE20673)/Homer | ZNF711 | 245 | 98779 | 19098 | 10652739 | 1.38345904871476 | 1.59345282406859e-06 |
TWVGGTCCGC | HINFP(Zf)/K562-HINFP.eGFP-ChIP-Seq(Encode)/Homer | HINFP | 92 | 98932 | 7215 | 10664622 | 1.37454681945809 | 0.0038517231022518 |
GCCACRCCCACY | Klf9(Zf)/GBM-Klf9-ChIP-Seq(GSE62211)/Homer | Klf9 | 931 | 98093 | 74030 | 10597807 | 1.35868651795896 | 1.06086771763029e-18 |
NNCACCTGCN | E2A(bHLH),near_PU.1/Bcell-PU.1-ChIP-Seq(GSE21512)/Homer | E2A | 615 | 98409 | 48906 | 10622931 | 1.35744374862607 | 7.92389543335335e-13 |
GAGCCTGGTACTGWGCCTGR | ZNF322(Zf)/HEK293-ZNF322.GFP-ChIP-Seq(GSE58341)/Homer | ZNF322 | 1443 | 97581 | 115585 | 10556252 | 1.35054380817252 | 5.91542041548052e-27 |
GGCVGTTR | MYB(HTH)/ERMYB-Myb-ChIPSeq(GSE22095)/Homer | MYB | 85 | 98939 | 6825 | 10665012 | 1.34248473138453 | 0.00955284635209933 |
ATGCCCTGAGGC | AP-2alpha(AP2)/Hela-AP2alpha-ChIP-Seq(GSE31477)/Homer | AP-2alpha | 461 | 98563 | 37166 | 10634671 | 1.3383339817007 | 2.94136108801228e-09 |
NRGCCCCRCCCHBNN | KLF3(Zf)/MEF-Klf3-ChIP-Seq(GSE44748)/Homer | KLF3 | 1379 | 97645 | 111645 | 10560192 | 1.335814286027 | 3.28264496541527e-24 |
CAAGGHCANV | SF1(NR)/H295R-Nr5a1-ChIP-Seq(GSE44220)/Homer | SF1 | 358 | 98666 | 28998 | 10642839 | 1.33169320334341 | 2.57489163492042e-07 |
第一组数据(GWAS或QTL分析相关)
这组数据看起来像是基因组关联研究(GWAS)或数量性状位点(QTL)分析的结果,主要研究基因组中的变异(如单核苷酸多态性,SNP)与某种性状(可能是基因表达的节律性)之间的关联。
数据字段解释:
- ID:变异的唯一标识符,格式为
染色体_位置_REF_ALT_版本
,例如chr1_27360875_C_G_b38
表示位于1号染色体27360875位置,参考等位基因为C,替代等位基因为G,基于GRCh38基因组版本。 - Chromosome:染色体编号,如
chr1
表示1号染色体。 - Position:变异在染色体上的位置。
- REF:参考等位基因。
- ALT:替代等位基因。
- rhyGene.ID:与节律性相关的基因的ID,例如
ENSG00000000938.12
是Ensembl基因ID。 - rhyGene.name:基因名称,如
FGR
。 - Sample.size.0/1/2:不同样本组的样本数量,可能是根据某种表型或条件分组的样本数。
- pval_0/1:与节律性相关的p值,表示该变异与节律性性状的关联显著性。
- phase_0/1:节律性相位,可能表示基因表达的周期性时间点。
- amp_0/1:振幅,表示基因表达的强度变化。
- Chosen.model:选择的统计模型编号。
- G.test_pval:G检验的p值,用于评估模型的拟合优度。
- pval:最终的p值,可能是经过校正后的显著性水平。
数据示例分析:
- 第一行数据
chr1_27360875_C_G_b38
显示,该变异与基因FGR
的节律性表达显著相关(pval_0
为0.000180832419495009
),且在两个样本组中振幅和相位有所不同。 - 第二行数据
chr1_28566248_G_A_b38
显示,该变异在另一个样本组中与节律性表达的关联更为显著(pval_1
为4.40078612105749e-06
)。
第二组数据(转录因子结合位点分析)
这组数据看起来是关于转录因子结合位点(TFBS)的分析,可能是通过ChIP-Seq实验和Homer工具进行的。
数据字段解释:
- Motif:转录因子结合位点的序列模式,如
HAWGRGGCCM
。 - Name:转录因子结合位点的名称,可能包含实验信息。
- TF:转录因子的名称,如
Zac1
、ZNF711
等。 - rhyQTL+Motif+:与节律性QTL(数量性状位点)相关的结合位点的正向计数。
- rhyQTL+Motif-:与节律性QTL相关的结合位点的负向计数。
- rhyQTL-Motif+:与节律性QTL无关的结合位点的正向计数。
- rhyQTL-Motif-:与节律性QTL无关的结合位点的负向计数。
- OddsRatio:比值比,用于评估转录因子结合位点与节律性QTL之间的关联强度。
- p.value:显著性水平,表示转录因子结合位点与节律性QTL之间的关联是否显著。
数据示例分析:
- 第一行数据
HAWGRGGCCM
显示,转录因子Zac1
的结合位点与节律性QTL显著相关(p.value
为1.03295297264592e-09
),比值比为1.39272803677047
,表明结合位点的存在可能增加了节律性QTL的关联性。 - 第二行数据
AGGCCTAG
显示,转录因子ZNF711
的结合位点也与节律性QTL显著相关(p.value
为1.59345282406859e-06
)。
数据的关联性
这两组数据可能来自同一个研究项目,但分析角度不同:
- 第一组数据关注基因组中的变异(如SNP)与基因表达节律性之间的关系。
- 第二组数据关注转录因子结合位点与节律性QTL之间的关系。
两组数据的共同点在于都与基因表达的节律性相关,但第一组数据更偏向于基因组变异层面,第二组数据更偏向于转录调控层面。通过结合这两组数据,可以更全面地理解基因表达节律性的调控机制,例如某些基因组变异可能通过影响转录因子结合位点来改变基因表达的节律性。